我们分析了含有100,000个补丁的结直肠癌(CRC)组织病理学数据集的离线和在线三胞胎挖掘的效果。我们认为在线和离线采矿中,极端,即与给定锚的最远和最近的补丁。尽管许多工作仅着眼于在线选择三胞胎(批次),但我们还研究了以离线方式训练之前的极端距离和邻居补丁的效果。我们分析了极端案例的嵌入离线距离与在线采矿的影响,包括易于正面的,批处理半硬度,批处理硬线挖掘,邻里组件分析损失,其代理版本和距离加权采样。我们还根据极端距离进行了在线方法,并根据数据模式进行了全面比较离线和在线挖掘绩效,并将离线挖掘解释为具有大型迷你批量大小的在线挖掘的可拖延概括。同样,我们讨论了不同结直肠组织类型的关系。我们发现,离线和在线挖掘方法在本研究中具有可比的特定体系结构(例如RESNET-18)具有可比性的性能。此外,我们发现包括不同的极端距离在内的各种情况是有希望的,尤其是在在线方法中。
translated by 谷歌翻译